云平台一键部署【 VibeVoice】长对话式文本转语音模型
VibeVoice 是一个用于从文本生成富有表现力、长篇幅、多说话人对话音频(如播客)的新型框架。它解决了传统文本到语音(TTS)系统中的重大挑战,特别是在可扩展性、说话人一致性和自然话轮转换方面。
VibeVoice 是一个用于从文本生成富有表现力、长篇幅、多说话人对话音频(如播客)的新型框架。它解决了传统文本到语音(TTS)系统中的重大挑战,特别是在可扩展性、说话人一致性和自然话轮转换方面。
最近,微软悄悄把开源的语音生成模型 VibeVoice 全都下架,只留下一个 1.5B 的小模型。
微软 vibevoice 微软vibevoice vibev 2025-09-12 19:02 7